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1 Das klassische ProzessormodeU 

In dieser Schrift wifd ein ProzessormodeU fur rekbnfigurierbare Architekturen vor- 
gcschlagen, das in wesentlichen Punkten an das Modell elnes klassischen Prozes- 
sors angelehnt ist, Zum besseren Ve rstSndnis wird zunachst das klassische Modell 
naher hetrachtet Dabei wird auf die Betrachtuttg pfozesaorexterfler Ressourcen 
(z. B. Hauptspeicher fur Programm und Daten etc.) verzichtet 

Ein Prozessor fUhrt in einem Froze/3 ein Programm aus. Das Programm besteht 
dabci aus cincr endlicfaen Menge vonHefehlen (Diese Mcngc darf JE].ementernehr- 
fech enthalten) sowie Informationen iiber die Reihenfolge, in der Befehle auf ein- . 
ond&rfolgen kSnnen. Diese Reihenfolge wird prim fir iiber die linenre Anordrmng 
der Bcfohle im Prograinmspeicher und die Ziele von Sprungbefehlen festgelegt. 
Befehle werden dabei ublicherweise iiber ihre Adresse identifizlert Als Beispiel 
zeigt Abbildung 1 (a) ein Programm in VAX-Assembler zur Exponentiation. 

Man kann ein Programm auch als gerichteten Qraphcn auf&ssen, wobei die Be- 
febte die Kuolen bUdeii, uod die Reihaufulgw Kaulen des Graphen modeHiert 
wird- Dieser Graph wird in Abbildung 1(b) gezeigt Der Graph besitzt dabei einen 
emdeutisejn. Start- und einen eindeutigen Endknoten. (Im BiJd nicht gezeigt, dumh 
die Pfeile angedentet) Die Kanten kdnnen zusatzlich mit Ubergangswahrschein- 
liohkeiten markiert werden. Diese Ihfoonation kann dann zur Sprungvorhersage 
genutzt werden. 

Durch die lineara "Ajoordaung der Befehle im Speichor ergeben sich mehr Ab- 
hangigkehen als unbedangt notwendig. So srad z.B. im gezeigtcn, Eei&piel die. 
Befehle DBCL und MULL2 voneinander unabhangig. Dies geht aus dem Qraphcn 
in Abbildung 1 (b) nicht hervor. Das Modell kann entsprechend erweitert werden 
durch Aufteil- und Zusammenfi^sungsknoten. Dies ist in Abbildungl (c) gezeigt 
Heutige Prozessoren erkermen dexartig© Mdglichkeiten der Parallelausfiihrung zum 
Teil in Hardware u»d verteilen die Opcranonenauf vcrschJedene Recheuwerke. 

Fur die welteren Betrachtungen wird das Modell aus Abbildung 1 (b) verwen- 
det. Die Behandlung der zusatzlichen Komplexitat des Aufteilens und Zusainmen- 
rassens wird auf einen spfiteren Zeitpunkt vecschobea 

Bin ProzeB braucht zu seiner AusfTibnmg nufier dem Programm weitere Res- 
sourcen. Diese sind inncrhaib des Prozessors die Register und die Status-Flags. 
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Abtrildung 1: Einfaches Beispielprogramm (Exponentiation) 



Der Program Counter (PC) ist nicht Tcil dieser Ressourcen, er wird Iediglich be- 
notigt, um eine Teilmenge der Kantct) des Graphen 2u r eajisieren. 

uie obcn angesprochenen Ressourcen dienen dazu, Informaiionen zwischen 
den einzelnen Befehlen des Programing zu ubennittehi. 

R<5 1st Anffiahft de* BelrifihswystenvQ, riafTir 7ni Rni^en, riaB fiinam Phw.R die 
zu seiner Ausfuhrung benfitigten Ressourcen zur Verfugung stehen und bei seiner 
Beendigung wieder freigegebeu werden. Heutige Prozessoren besitzen flblicher- 
weise mireinen Registersatz, so cia£ nur ein ProzeB gleichzeitig auf dcm Processor 
ablaufen kann. 

Man kann sich Icicht vorstcllcn, daft die Bcfohlo von zwei untctsohtedlichen 
Prozessen in beliebiger Reihenfolge durchmischt ausgefflhrt werden konnen, so- 
lange beide Piozesse disjunkte Ressourcen verwenden (z, B. VrozcQ 1 verwendet 
die Register 0-3, ProzeB 2 Register 4-7). 

Befehle eines Prozessors haben ublichcrweise die folgenden Eigenschaften: 

• Ein Befehl wird wahrend der Ausfuhrung nicht unterbrochen. 

• Die Ausfuhrangszeit aller Befehle uberschreitet einen gewissen Maximal- 
weit nicht 

• UngQltige Befehle werden vom Prozessor erkacnt 

2 tjbertragung des Modells auf die XPP-Archftektur 

Die XPP-Architektur ist einc cekonnguiierbare Prozessorarchitektur, die wesent- 
hch dure* die Patent(eXanrneldungen) PACTOI, 02, 03, 04, 05, 07, 08, 09, 10, 
13, 17, 22, 23, 24 dofiniert ist Diese Sohrrften werdou zu Offimbarungszvvechftn 
voHum^ngUcheingegleidert. EbenMs wird auf PACT 11, 20,27verwiesen, in de- 
nen entsprechende Hochsprachen-Compfler beschrieben sind, sowie auf PACT 21, 
worki eio cntsprechender Debugger beschrieben ist Auch diese Schriften werden 



2 . 
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zu OrTenbaxungszwecken vollsiSndig eingcglicdcrt Samtliche olfenen PriorMten 
aus den vorgenanjnten Stahriftttn warden hermit he.ansnrimhi' 

Der klassiscbe Befehl wind ersetst durch einen Komplex-Befehl (Complex In- 
- truction Word, CIW). Dies entspricht der Konfiguration im bekannten Sinne. Die 
Kanten den Graphen in Abbildung 1 (b) werden realisiert durch Kvcnts ait die CM- 
Ports. Damit kann ein vollstandiges Programm realisiert werden. 

Fur den Registersatz eineo klasfiiechsn, Proaeseore gibt <as zur Zeit nock keiue 
Entsprechung auf der XFP-Arcbrtektur. Die benotigten Eigensehaften. lassen sich 
aber dennoch beschreiben: 

• Da die XPU im wesentlichen auf Datenstromen arbeitet^mufi ein Register in 
der T^»3ft sain, einen Datenstmm hzw. Tsile davnn m speichern. 

• Ein Register muft alloziert und fireigegeben werden konnen. Dabei muB 
cs so iangc belcgt blcibcn wic das Programm auf de& XPU l&uft, (IIW- 
Unterstutzung der Ressourcenverwalumg des petriebssystems.) 

■ Gleicnzeitiges Lesen und Schreiben (Read-Modify- Write) desseiben Regi- 
■ sters sollte moglich sein. 

B$ wird vorgeschlagen, entsprechend modifizierte RAM-Objekte zu verwenden. 
Diese sollen zunachst als Register verwendet werden. Eine atisfuhrlichc Bcschrei- 
bujjg des Rcgistcr-Objckts findest sich in Abscuulu 4. 

Eine Konfiguration (CIW) wird in dem Moment vom Array entfemt, in dem 
sie ubcr einen Event an einen CM-Fortdas nictate CIW anfoxdert. Der Reconfig. 
Event kann dabei entweder iiber den Reconng-Port eines ALU-Objekts oder impH- 
zit vom Port-Objekt erzeugt werden! In spatcren Versionen sollte dies grundsSt^ 
lien vom Port-Objekt aua erfblgen. 

Ebenso wie Befehle auf einem klassischen Prozessor nicht unterbrochen wer- 
den, lauft auch ein CIW auf der XPU ohne Uttttafcrecbuns bis es das nnohato CTW 
fiber einen CM-Port anfordert. Es wird nicht vorzeitig beendeL Urn dcxaxoch einen 
regelmafiigen Befehlswechsel sicherstellen zu kSnnen (dieser wird spater fur Mul- 
titasking ben6 tigt), wird die maximal* Ausfuhrungszeit eines CIW nach oben be- 
schrankt Damit wird die zweite Eigenschaft cuies Befehls gefordert Es i$t Auf- 
gabc dca Compilers, dafur zu sorgen, daS jedes erzeugte CIW dioscr Bcdinguug, 
genugt. Ein CIW, das diese Bedingung verietzt, ist ein ungultiger Befehl, Er kann 
von der Hardware wMhrend der Ausfuhrung z. B. Ober einen Watchdog-Timer er- 
kannt werden. In diesem Pall wird das ungultige CIW Ober einen Reconfig beendet 
und eine Exception an das Betriefassystcm geschickt 

Da die CIWs schr Jang sind, sind dementsprechend auch die Instruction-Fctch- 
(Config-Request bis Code 1st im FILMO-Cache) und Instruction-Decode-Zeiten 
(Verteilung der Conng-Daten vom FTTMO-Canba m rife Coiifig-Register der Ob- 
jekte) sehr lan^. Dadutcb ist die Auslastung der Execution Units (Array) durch 
einen ProzeB nicht schr hoch. Wie dieses Problem mit mehreren Prozessen gelost 
werden kann, wird in Abschnitt 6 gezeigt 
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Abbtfdung 2: Beisplel fiir ein Uhterprogramm mit Aufiuf 




r a 



Abbildung 3: Dynamisch veranderter Graph wahrend dcr Ausfuhrung ' 
3 Unterprogramme 

Bin XJnterprogramtn in dcr Grapbetidarstellung i&t ein Teilgraph eines Programms 
mit eindeutig bestimmtert Eingangsknoten, Die Kante des Unteiprpgrammauftufe 
innerhalb des Graphen ist dadurch statiscfa bekannt. Die weiterfDhien.de Kante am 
Ausgang&knoten des Unteiprogramms ist jedoch nicht statisch bekannt. In Abbil- 
dung 2 wird dies v<5rdeutlicht. Die Kanten vom Hauptprogratnm zum Unterpro- 
granun slnd vorbauden, die Fonfuhiuag uttvh dtau UuU2iprograrair\ ist jedoch im 
Unterprogramm nictit bekannt. Die jeweiHge Foitfuhnmg ist fest mit dem Untcr- 
programmaufruf verbunden (dureh gestrichelte bzw. gepunktete Liniea markiext). 
Sie mufl vor dem Erreichen des Eingangsknotens in geeigneter Weise in den Gra- 
phen eingefugt werden. Dies ist in. Abbildung 3 verdotitHcht 

In klassischen Prozcssoicn geschieht dies Ublicherweise dadurch, datf beim 
Unterprogramrnaufruf (Call) die Adressc des auf das Unterprogramm folgenden 
Befehls (das ist genau die fehlende Kaxxte) auf einem Call-Stack abgeJ.egt wird. 
Von dort Kann sie beim R&ckspnmg (Return) geholt werden* 

Ubertragen auf die XPU wird also ein Stack-Objekt benfitigt. Dies ist genauso 
wie die Register-Objekte eine Pro2eB-Ressource und wild genauso verwaltet Das 
dW, das bci seiner Beendigung den Unterprogrammaufiruf veranlaBt, konfiguriert 
die Rucfcspning-Kantc auf das Stack-Objekt. Durch okieu Event veranlaBt das 
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(s) Zeiger vor der Leseoperation (b) Zeioer naoh der Leseoperation 
Abbildung 4: Beispicl fur cine Rcgis^Lcscoperation 



lebfte CI W des Uaterprogramms das Staok-^Objekt, den bbersten Eintrag vom Stack 
*n entfernen lmd als Config-RequeRt an den CM zu schicken. 

Eine ImpJementierung kann bctspielsweisc zunfichst Obex eine Software-L6- 
sting iririerbalb des CM erfolgen. Dabei wild eine spezielle Config -ID (z> B. -1) als 
Rucksprung reserviert. Werm der CM diese ID erhalt, ersetzt er sie durch den ober- 
sten Eintrag seines lokal verwalteten Stacks. Spate? kann dies dutch ein eigenes 
Objekt odet eitx ontspreohend erweitertes Port-Objekt crfolgcn, 

Stack-Overflow sowie Stack-Underflow sind Exceptions, die an das Betriebs- 
systern weitergegeben werden. 

4 Das Register-Objekt 

Eln Massisches Prozessoxxegister enthalt zu jedem Zcitpunkt ein Datenwort. Bin 
Beffehl kaiui don Rcglsterlnlialt lcscn, sclueibsn odw veiaudcni (Read-Modiry- 
Write). Bin XPU-Register sollte die gleiohen Kgensdhaften aufWeisen, allerdings 
entfaalt es start eines einzelnen Wertes einen Wertevcktor Oder Teile davon. 

Ublicherweise dfirfle die Organisation eines XPU-Registers als einc Art FIFO 
die gunstigste Moglichkeit sein. In bestimmtcri Fallen kann aber auch wahlfircier 
Zugriff erfordcriich werden, JLm. folgenden werden die droi oben angesprochenen 
Registerznigriffe im einzelnen crlaatert, Dabei wird ein wahLfreicr ZugxirX nicht 
betrdciztct. 

)Useadgriff Beim Start eines C1W enthalt das Register einen Datenvektor unbe^ 
karmter Lange, Die einzelnen Elemente des Vektprs werden sequentiell enmom- 
men, Dabei wird beim letzten Element des. Vektors ein, Event generiert, der anzeigt, 
daQ das Register jetet leer ist und das CJl W tenmnieren kann, 

Der Zustand des Registers kann dabei mit 3 Zeigern charakterisiert werden, 
sie zeigen auf den ersten, letzten und akrudlcfl. BJntjrag im Datenvektor. Dio Stol- 
lung der Zeiger zu Beginn eines C1W wird beispielhaft in Abbildung 4 (a) gezeigt 
Dabei stent der Zeiger fur den aktuellcn Eintrag auf dem ersten Eintrag. 
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In Abbildung'4 (b) zeigt in einem Bcispicl, wic die Zeigersteliong eines Regi- 
sters am Fnrfps enne* f!TW smg&efoen lcann. Tm dnrt gezeigten Fall wiirde der Vektnr 
nicht vollstandig gelesen. 

Nun'muB entschieden werden, was rait dem Registerinhalt geschieht. Es gibt 
diefoIgendenMdgkchkeiten: 

• Das Register wird gelecrL AUe nicht verarbeiteten Daten werden geloscht 
Der Zeiger fur den aktuellen Eintrag wird auf den letzten Eintrag gesetzt. 

• Das Register wird auf den Ursprungszustand zuruckgesetzt Dadurch kann 
das naohste CIW wiedex auf den vollen Datcnvcktor zugrcifen. Der Zeiger 
fur den aktuellen Eintrag wird auf den ersten Eintrag zuruckgesetzt 

• Nut die bereits gelesenen Daten werden aus dem Register entfernt. pie un- 
gelesenen Daten Stehcn fur das nachste CIW zur Verfugung. Die Zcigcr 
werden dabei nicht verandert. ' 

Irxt AnschluB daran werden die Werte zwischen, dem ersten Eintrag und dem 
aktuellen Eintrag aus dem Register entfernt Sie stehen fur weitere Operationen 
• nicht rnehr zur Verfugung. 

Die dritte Mdglichksit ist insbesondere dann interessant» wenn ein CIW anf- 
gmnd der inaximalen Ausruhrtmgszeit fGr em CIW den Datenvektor nicht voll- 
standig verarbeiten kann. Siehe hierzu auch Abschnitt 7. 

SehreibzusrirT Hier werden Daten sequentiell in das Register geschrieben. Da- 
bei wird ein Event generiert, Venn der Fullstand des Registers einen bestimmten 
Wert erreicht Je naoh CIW kann dies eine der folgenden Mdglichkeftcn sein: 

• Das Register ist vollstandig gejRillt 

• 9, ? d no( & S*«a« ™ EintrSgc im Vcktor frei. Dies bcrucksiolitlgt die L*- 
tenzzeit im CIW, durch die noch n Werte naoh dem Event auf das Register 
laufen. 

• Das Register ist zu m% gefullt 

Ein CIW, das versucht, auf ein vollstandig gefulltes Register zu schxeiben, ist 
ungultig und wird mit eincr Exception beendet (Illegal Opcode). 

Beim Start des CIW muS festgelegt aeitt, in wclclicm Zustand sick das Register 
befindet Abbttdung 5 (a) zeigt ein Register voreinemSchreibzugri^ dasnochDa- 
ten enmalt Bestehende Dateri konnen gelSscht werden, so daft der Schreibzugriff 
nut einem leercn Vcktor beginnt (Abbildung 5 (b)). Altemativ konnen die ge- 
schriebenen Daten aoch an den bestehenden Inhalt angehingt werden. Dies zeigt 
Abbildung 5 (e). Dies isi dami interessant, wenn das vorhergehende CIW nioht den 
kompletten Vektor erzeugenkonnte aufgrund der maximalen Ausfuhrungszeit 

Dot Zustand des Registers rwnh w-Jblgtex Scfareiboperation zeigt Abbildung 
5 (d) bzw. (e). DJcneugesehriebenenDatensind dabei schrafBert gekcrmzeichnet 
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a aktueller Elntrag 
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Abbildung 3: Beisplel rUr eine Register-Schreiboperation 

paralleler Schreib-/JLesezugri£i Die Jaeschrauioing auf reuie Schreib^ bzw. Lc- 
sezugrilfe erfbrdcrt cine hdhcrc Registerzahl als ndtig. Wenn einem Register durch 
Lesezugriffe Oaten entnommen warden, entsteht dadurch Plata, in dem Schxeibda- 
ten aufgenommen werden kSruaen. Es mufi lediglich sichergestellt werdsn, daB 
geschriebene Daten nicht vom gleichen CIW wieder gelesen werden konnen. Da- 
zu wird in den FIFO eine virtuelle Trennlinie eingciuhrt Das Register wurde 
voHstandig gelesen, wenn diese Trennlinie am Ausgang des FIFOs angelangt ist 
Kann oin Schtoibzugriff fur cin Datcswort nidit ausgefuhrt werden, wcit das Re- 
gister noch mit ungelesenen Lesedaten blockiert ist, wird das CIW beeadet und 
eine Illegal Opcode Exception erzeugt Das Verhalten des Registers ist ansoasten 
genauso wie bei Schreib- und Lesezugriff erlautext 

ZusatzUph niufl spczofbricit werden, was mit der virtucllcn Trennlinie zwisohen 
Lese- und Schrefbdaten geschicht, Diese kann entweder an dcr Steiie verbieiben, 
wo sie gerade stent. Dies ist dann nutzllch, wenn ein CIW aufgrund der Zcitbe- 
schrankung heendet werde mnR. Alrernath/ wittf die Trennlinie an das finds alter 
. Daten gesetzt. 

Kombinierte Schreib-ZLcsezugriffe sind problematisch, wenn das CIW mit ei- 
ner Exception beendet wurde. In diesem FaU ist es nicht mehr moglich, die Re- 
gister- auf ihre Werte beim Start des CIW zuruckzustellen. Das Debugging wird 
dadwph xnindoetens enschwert, oiehe ttuoh Aboehiutt 8. 

Abbildung 6 zcigt die Funktionsweise an einem Beispiel. 2u Begirm enthalt 
das Register Daten (a), die 3m folgenden teilweise fb) bzw. vollstSndig (c) gelc- 
sen werden. Neu gescbriebene und gelesene Bintragc sind dabei durch Schraffur 
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Legende: 

& s?ikLutj;Her EInlrag 

I letter Elntrag 
e erster Eintrag . 
v virtuelle Grenze 

1^1 neu geschrleben 
1^ gelesen 



(d) 



Abbildung 6: Beisplel fur due Rcgiatcr-SchTeib-ZLeseoperation 

> 

gckcnnzcicbnct Die Tcilbilder (d) und (c) zeigen den Zustand des Registers nach 
dem notwendigen Zeiger-Update. Dies ist kein expliziter Schritt, sondem wird hier 
nur zur Verdeutlichimg dargestellt. Die gelesenen Eintrage mikssen sofort entfemt 
werden, urn Plate fur die neu zu scfareibenden Eintrage zu scbaffen. 

Bin Prozefl muB jedes benotigtc Register auoziereii, bevor er es verwenden 
kann. Dies geschiebt Ober em zweites CM-Interfece des Registers. Dort wird auch 
eingetragen, zu welchem ProzeB das Register jetzt gehort, Diese Konfiguraticra 
blcibt auch fiber irjaptezite Reconflgs hinweg eihalten. Das Register muiJ explizit 
vom CM frelgegeben werdetL Dies gescliicht bci dcr Bccndigung cines Trozscsscs. 

Mit der Konfiguration jedea CIWs mufl den Register* mitgeteilt werden, zu 
welchem ProzeB das ClW gehort. Dies ermoglioht das Umschalten zwischen. uaeh- 
Teren RegistersiUzen. Das Verfehren wird genauer to Abschnitt 6 beschrieben. 

i 

5 Interrupts 

Bei Interrupts muB zwischen zwei unterschiedlicheo Typed unterscaieden wcrdeo, 
Zum einen gibt es die Hardware-Interrupts, wo der Processor auf ein externes Er- 
eignte reagieren muB. Diese werden nhlioberweisft vom Betriebssystem bearbeitet 
und sind fvx die laufenden Prozesse nicht sichtbar. Sic sollen hier nicht welter 
behandelt werden. 

Der zweite Typ sind die Software-Interrupts. Diese werden haufig benutzt, urn 



8 
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asynchrpne Interaktionen zwischen PtozeG und Betriebssystem zu reaiisieren. So 
ist es z. B. xinlftr VMS mngHnh; nine T ^ftflnfinrdfrnwig an d»« n«trifthsAystern km 
schicken* ohne auf die eigentlichen Daten zu warten. Sobald die Daten vorhanden 
sind, unterbricht das Betriebssystem das laufende Programm und ruft asynchron 
eine Prozedur des Progrannns auf. Dieses Verfehren nennt sich dort Asynchronous 
System Trap (AST). 

Diesee Verfehron kann in glcichcr Form auf dor XPU origewendet werden, 
Hierzu ist Unterstfltzung im CM vorzusehen- Der CM weiB, ob eine a&ynchrone 
Routine fur einen ProzeB aufgerufen werden mufl. In diesem Fall wird der nSchstc 
Request, der vom Array kommt, nicht direkt abgeaibeitet, sondera gespeichert 
Stattdessen wird eine Fblge von ClWs eingefiigt, die zunSchst die Prozessorstatus 
(die R«gi»UaiiUA»lics) abAivm, die ttsyuvluujus Routine ausXQlneu und daun die Re- 
gistcrinhaJte wjederheiitellen. Im AnschluB daran kann der ursprttngliche Request 
abgearbeitet werden. 

6 Multitasking 

In Ab$chnitt 2 wuidc fcstgcstellt, daB die XPU-Architekfur mit nur einem Pro- 
zeB nicht ausgelastet werden kann aiifgmnd der )Unge der CI Ws sehr hone Uide- 
und Dekodierungszeiten auflreteaL Dieses Problem, kann durch die gleichzeitige 
Ausfuhrung mehrerer Prozesse gelost werden. Hierboi werden auf der XPUmehre 
rc RcgistcrsSfcfiC vorgeschen, damit beim Kontextwechsel einlach zwischen den Re- 
gistersatzen umgeschaltet werden kann und forme aufwendigen Rjegister-Freiraum- 
und -Lade-Operatjonen erforderlich werden. 

- Wahrend der Ausfuhung von Befehlen anderer Prozesse steht geniigend Zcit 
zur Vcrfugung, urn don nSohfltcn Bcfchl des aktucllcn TVo«* $es zu holcn und ubcr 
den FILMO an die Objekte zu verteilen. Die optimale Anzahl an Registersatzen 
mufl dabei in AbhSngigkeit von der durchschnittlichen Ausfuhrungszeit cities CTW 
und den durchschnMichen Lade- und Dekofflcrcciten der OWs bestimmt werden. 
Dabei kann Latenzzeit problemlos durch eine groBerc Anzahl Registersatze abge^ 
rangen werden. Wichtig fur die Funktion des Verfehrens ist, das die durchscbnittli- 
che CW-Laufzeit groBer ist als die jcweils efiektiv benStigte Zeit zum Laden bzw 
Pekodieren des CTW. . " ■ 

Die komsspondicrenden Register der unterschiedlichcn Registersatze liegen 
dabei fur den Prograxmnierer auf derselben Objektadrcsse. Dabei kfinnen zu je- 
dem 2eitpuhld iroraer nur die Register eines Regisiersatzes verwendet werden. 

Der Kontextwechsel zwischen den Registersatzen kann dadurch realisiert wer- 
den, daft vor jedem CIW der entspmchende IContcxt an die Objdkto ubeilragcn 
wird Dieses Verfohren wurde bereits Jn Abscbnitt 4 angesproohen. , 

Im aHgemeinen werden auf einem' System mehr Prozesse vorhanden sein als 
Registersatze auf dem Prozessor. Das bedeutet, dafl gelegentlich ein ProzeB vom 
Prozessor entfemi werden muB. Dazu wild ahnHch wie bclm Software-Interrupt 
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elne Kante den Prograinnigraphen vom CM aufgetiennt Die Registermhaltc dcs 
Pto^wj! warden gesichert und die vom ProzeB allozierten Prozessoiressourcen 
i(Register, Stack-Objekr,. etc.) wieder freigegeben. Die so ftcigewofdenen Res- 
sourccn werden nun von einem andcrcn ProzeB alloziert Dann werden die fur die- 
sen ProzeB gespeicherteo Rcgisterinnalte wieder zuruckgeschrieben und der Pco- 
zefl an dessert aufgetrennter Kante fortgesetzt 

Daa Sichern und RQckladen der fccfiteterlnhalte kann dabei fiber CIWs erfol- 



7 CIW und Schleifen 

Aufgrund der oben gefoTderten Eigenschaft, daB ein CIW, spatestens nach einer 
gewissen Maximalanzahl an Takteo terminieren mun, konnen allgemeine Schlei- 
ffcn biclu, uhne weil*i©s in ein CIW ubcrsctzt werden. Es ist immer moglich, den 
Schleifenrumpf in ein CIW zu ubersetzen und die SchleiienkontroUo ubcr Rekonfi- 
guration abzuwickeln. Dies kostet jedoch jegHche Performance. Dieser Abschnitt 
. zeigt, wie eine Schlcife so umgeforrnt werden kann, daft die Anzahl der Rekonfi- 
gurationen minimiert wird- 

Jm fblgcnden wird von folgendem Programmstuck ausgegangen; 

while (condition) { 
something; 

} 

Dabei soil sowohl die Laufeeit von condition wie something bestimmt odcr 
nach oben abgescMtzt werden k6nnen. Die Schleife kann nun wie folgt umfonnu- 
Mcxt werden; 

while (1) { 

i£ (J condition) goto finish,; 
something; 

} . 

finish: 

Nun kann der Schleifenrumpf 50 oft iteriert werden wie ee die maximal* Juurf 
zeit eines CIW zulafit Hierzu wird eine neue Variable z eingefuhrt, die wedet in 
condition noch in something vorkommt. Das Programm sieht nun folgen- 
ucrmaBcn aus: * 

while (1) { 

for (z«0; 2<MAX 7 z ++) { 

if Ucondition) goto finish; 
something; . 

} 

} 

finish: 

10 
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Die f or-Schleife besitzt eine vom Compiler bestiminbare maximaleXaufeeit Sie 
Varm d"««hfllh auf ein CIW abgebildet werden; MAX wird vom Compiler in Ah- 
hangigkeit von der maxirnalen Laufeeit und den Einzellaufzeiten der Anweisungen 
bestimmt 

Das so entstehende CrW hat swei Ausgangskanten. Der Ausgang uber das 
goto fOhrtzumnEchsten Cr^derAusgianguberdasi^lareEnde desf orbildet 
eine Kant© auf aich selbet Daruber wird die Endlosachleife realiaiert- 

8 Debugging 

Im klassischen Processor erfblgt das Debugging auf Befehlsbasis, 4 L der Ablauf 
eines Programme kann jederzeit zwischen zwei Befehlen unterbrochen werden. An 
diesen UnterbrechungspuiiktGn hat der Programmieier Zwgriff auf die Register, Er 
kann sic auschen und modifizieren. UntcrbrccJiuiigspunktc kdn&cn auf vcrschie- 
dene Art und Weise realisiert werden. Zmn einen kann das Programm modifiziert 
werden, d. h, der Befehl, vor dem angehalten werden soli, wird durch andere Be- 
fehle ersetzt, die den Debugger aufrufen. Ira Graphenmodcll cntspricht dies dem 
Austausch eines Knotens durch einen anderen Knoten oder einen Teilgraphen. Ei- 
ne andere Meihode beruht auf zusatzlicher Hardware-Unterstutzung. Hierbei wird 
dem Processor mitgeteilt, bei welchem Befehi das Programm unterbroohen wer- 
den soil. Der entsprechende Befehi wird dabei Oblicherweise uber seine Adresse 
identinert 

Beide Moglicnkeiten stehen auch auf der XPU zur Verfugung. Ein CIW kann 
jederzeit vom Debugger durch ein anderes dW ersetet werden. Dieses CIW kann 
z. B. die Rsgistdinhalte in den Hauptspeicher kopieren, wo diese cntweder mit ei- 
ttcm XPU extemen Debugger onajyaicrt werden konnon, Altomariv kann der De- 
bugger auch auf der XPU ablaufen. Weiterhln kann eine Hard ware-Unterstfitzung 
irt) CM vorgesehen werden, die CIW s bei deren Request arxhand der ID identifiziert 
und dann den Debugger aufruft. 

Zusatzlich kann cine TJnterbrechung aucji ein einer Kante des Graphen fest- 
geniauhl werden, da diese iin Gegensat* z\x klassischem Progratnmcode explizit 
vorliegen. 

Die oben besohriebenc Art des Debugging ist fur klassteche ProTBsworen vnll- 
standig ausreichend, da die Befehle zumeist sehr einfcch Sutd Eine binreichend 
feine Aufldsung der beobachtbaren Funkte ist gegeben, Weitemin kann sich der 
Prograrnmierer darauf veriasscn, daJB die einzelnen Befeble korrekt sind. (Dafur , 
J M j M S0T & ublicherweise der ProzessorherstelleE) Auf der XPU Mngegen denniert der 

"* * Prograrnmierer eich die Prozeasorbefchfo sclbst, Demcntsprcohcnd konncn die so 

definierten BcfcWc feMerhaft sein. Ein Debugging der einzelnen Befehle wird also 
erforderlich, im folgenden als Microcode-Debugging bezeichnet. 

Miorocode-Debogging erfordert einen erhebHchen Aufwand, da der Prograrn- 
mierer Zugriff auf alle internen Register nod Datenpfede des Processors haberi 
mufl. Eine rlardware-Unrersttlming hierffir ist sehr aufwendig und zu reinen De- 

11 
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bugging-Zweckcn nicht sinnvoll. Altcmativ kann der Zustand des Prozcasors vor 
dean ffragUchen Befabl gftainhert werden mid die Ausfubrung des eigentlichen J8e- 
fehls auf einem Software-Simulator erfolgen, 

Bei geeignctem Programmiermodell kann der Debugger auchbei Auftreten o> 
ner Exception inncrhalb elnes Befehls autgcrufen werden. Hieizu iBt ea notwcndig, 
daB die Register auf den Zustand vor dem Start des Befehls zuruckgestellt werden 
koxirtcn und sonst kcino. Scitenoffekte aufgetreten ifiind. Dann Watw der fragliche 
Befehl im Software-Simulator gestartet werden und bis zum Auftreten der Excep- 
tion simuliert werden. • 




12 • 
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